对自然声音刺激的脑电图反应进行分类具有理论和实践意义,但标准方法受限于对非常短的声音片段(几秒或更短)的各个通道分别处理。最近的发展表明,通过从脑电图中提取频谱成分并使用卷积神经网络(CNN),可以对音乐刺激(约 2 分钟)进行分类。本文提出了一种有效的方法,将原始脑电图信号映射到所听的单首歌曲,以进行端到端分类。脑电图通道被视为 [ 通道 × 样本 ] 图像图块的一个维度,并使用 CNN 对图像进行分类。我们的实验结果(88.7%)可与最新方法(85.0%)相媲美,但我们的分类任务更具挑战性,因为我们需要处理感知质量彼此相似且参与者不熟悉的较长刺激。我们还采用了使用预先训练的 ResNet-50 的迁移学习方案,证实了尽管图像域彼此不相关,但迁移学习仍然有效。